已经提出了需要树木,以模拟在开放域的文本问题答案的背景下进行解释产生的人类推理过程。但是,实际上,手动构建这些解释树是一个艰苦的过程,需要积极的人类参与。鉴于捕获从问题到答案的推理线的复杂性,或者从索赔中捕获了前提,因此出现了如何帮助用户有效地构建多个级别的树木,并给定大量可用事实。在本文中,我们将需要树的构造作为一系列主动的前提选择步骤,即,对于说明树中的每个中间节点,专家需要注释大型候选人列表中的前提事实的正面和负面示例。然后,我们迭代地进行精细 - 训练前训练的变压器模型,并产生了正面和紧密控制的负面样本,并旨在平衡语义关系和解释性的关系关系的编码。实验评估证实了拟议的主动精细研究方法的可测量效率提高,以促进累积树的构建:与几种替代方案相比,解释性前提选择的提高了20 \%。
translated by 谷歌翻译
在本文中,我们提供了针对深度学习(DL)模型的结构化文献分析,该模型用于支持癌症生物学的推论,并特别强调了多词分析。这项工作着重于现有模型如何通过先验知识,生物学合理性和解释性,生物医学领域的基本特性来解决更好的对话。我们讨论了DL模型的最新进化拱门沿整合先前的生物关系和网络知识的方向,以支持更好的概括(例如途径或蛋白质 - 蛋白质相互作用网络)和解释性。这代表了向模型的基本功能转变,该模型可以整合机械和统计推断方面。我们讨论了在此类模型中整合域先验知识的代表性方法。该论文还为解释性和解释性的当代方法提供了关键的看法。该分析指向编码先验知识和改善解释性之间的融合方向。
translated by 谷歌翻译
专门的基于变形金刚的模型(例如生物Biobert和Biomegatron)适用于基于公共可用的生物医学语料库的生物医学领域。因此,它们有可能编码大规模的生物学知识。我们研究了这些模型中生物学知识的编码和表示,及其支持癌症精度医学推断的潜在实用性 - 即,对基因组改变的临床意义的解释。我们比较不同变压器基线的性能;我们使用探测来确定针对不同实体的编码的一致性;我们使用聚类方法来比较和对比基因,变异,药物和疾病的嵌入的内部特性。我们表明,这些模型确实确实编码了生物学知识,尽管其中一些模型在针对特定任务的微调中丢失了。最后,我们分析了模型在数据集中的偏见和失衡方面的行为。
translated by 谷歌翻译
腹部器官分割是一项艰巨且耗时的任务。为了减轻临床专家的负担,非常需要完全自动化的方法。当前的方法由卷积神经网络(CNN)主导,但是计算要求和对大数据集的需求限制了其在实践中的应用。通过实施小而高效的自定义3D CNN,编译训练的模型并优化计算图:我们的方法可产生高精度分割(骰子相似性系数(%):肝脏:97.3 $ \ pm 1.3,肾脏:94.8 $ \ pm $ 3.6,$ 3.6,,$ 3.6,,$ 3.6,,,$ 3.6,,,$ 3.6,,,$ 3.6,,$ \ pm $ 3.6,,肝气脾脏:96.4 $ \ pm $ 3.0,pancreas:80.9 $ \ pm $ 10.1),每张图像1.6秒。至关重要的是,我们能够仅在CPU上执行细分推断(无需GPU),从而在没有专家硬件的情况下便利地促进模型的简单和广泛部署。
translated by 谷歌翻译
细胞因子释放综合征(CRS),也称为细胞因子风暴,是嵌合抗原受体疗法的最大程度不良反应之一,在癌症治疗中表现出了有希望的结果。当出现时,可以通过分析特异性细胞因子和趋化因子谱的分析来识别CR,这些因子和趋化因子谱倾向于在患者之间表现出相似性。在本文中,我们使用机器学习算法利用了这些相似性,并着手开拓元观看知识的方法,以基于特定的细胞因子峰浓度和先前临床研究的证据来识别CRS。我们认为,这样的方法可以通过将临床医生与过去临床研究的CR知识相匹配,以分析可疑的细胞因子谱,以Swift CRS诊断的最终目的。在使用Real-World CRS临床数据评估期间,我们强调了我们提出的产生可解释结果方法的潜力,除了有效地识别细胞因子风暴的发作。
translated by 谷歌翻译
激光粉末融合期间的局部热史(LPBF)过程中的局部热历史的变化可以引起微孔缺陷。已经提出了原位传感来监测AM过程以最大限度地减少缺陷,但成功需要在感测数据和孔隙率之间建立定量关系,这对于大量变量和计算昂贵尤其具有挑战性。在这项工作中,我们开发了机器学习(ML)型号,可以使用原位热度显数据来预测LPBF不锈钢材料的微孔。这项工作考虑了来自热历史的两个识别的关键特征:高于表观熔化阈值(/ TAU)和最大辐射(T_ {MAX})的时间。计算这些功能,为每个体素存储在内置材料中,用作输入。每个体素的二进制状态,无缺陷或正常,是输出。针对二进制分类任务培训并测试不同的ML模型。除了使用每个体素的热特征来预测其自己的状态之外,还包括相邻体素的热特征作为输入。这被示出了提高预测精度,这与各个体素周围的热传输物理符合其最终状态。在培训的模型中,试验组上的F1分数达到0.96,对于随机森林。基于ML模型的特征重要性分析表明T_ {MAX}对Voxel州比/ Tau更重要。分析还发现本发明体素上方的体素的热历史比它下方的血管素更有影响力。
translated by 谷歌翻译